查看原文
其他

案例丨联邦学习在证券公司适当性管理中的应用研究





近日,由中国证券业协会主办《中国证券》杂志2023年第8期刊登了长城证券方程署名的文章《联邦学习在证券公司适当性管理中的应用研究》,以下为文章全文。



境内外证券公司

投资者适当性管理发展概况


(一)境内证券公司投资者适当性管理发展概况

2008年发布的《证券公司监督管理条例》首次提出投资者适当性要求,在接下来的十多年时间里,创业板、股指期货、投资顾问、新三板、科创板等领域投资者适当性的制度相继发布。随着一系列投资者适当性制度的相关规定的出台,我国投资者适当性制度初步形成了规则体系和多元化的监管框架。2017 年实施的 《证券期货投资者适当性管理办法》(以下简称《管理办法》)及配套自律规则《证券经营机构投资者适当性管理实施指引(试行)》(以下简称《实施指引》)标志着我国投资者适当性管理进入了一个全新的时代。

《管理办法》实施以来,市场参与主体在完善适当性管理制度上做出了不懈的努力,但仍存在着一些问题亟待解决完善。部分经营机构处于成本效率的考虑,追求短期效率,致使适当性管理工作仅仅达到了“表面合规”,为市场健康发展留下隐患。具体表现为投资者信息缺乏核查、客户评价结果失真、信息共享机制有待完善等。

适当性管理的核心是将合适的产品和服务推荐给合适的人。在对金融产品和服务地认知和了解上,投资者处于弱势地位;在对投资者的全面真实地了解上,证券公司属于信息弱势的一方。这就形成了证券公司、投资者、产品之间的信息不对称。

为落实适当性管理要求,证券公司需要在信息系统、内部机制、人员培训等方面投入大量的资源。这类成本投入很难给公司带来直接经济效益,这就使得证券公司缺乏足够的主动性去完善、优化适当性管理要求。随着证券投资者数量和业务类型的快速增长,如果仍然采用传统模式和手段去推进适当性工作,很可能引发适当性成本和业务发展隐患的“双升”,因此证券公司乃至全行业必须要借助先进的思路、技术和方法,寻找到一条降低适当性成本的可行路径。


(二)境外证券公司投资者适当性管理发展概况

投资者适当性管理起源于美国,对投资者适当性的监管,美国、欧盟、英国、日本等大多以原则监管为主,在适当性信息共享、管理工具创新等方面,境外资本市场积累了丰富的经验。

1、信息共享机制

境外适当性信息共享机制在降低信息成本、提高管理效率、信息真伪验证等方面起到了良好的效果。例如,美国证券经营机构在向投资者披露隐私保护制度及措施后,便可与关联公司充分共享投资者非公开财务信息;欧盟的适合性、适当性及最佳执行指引规定了证券公司在进行适合性评估和适当性评估时,都可以采纳外部数据。

2、工具创新

境外适当性管理多数创新做法主要体现在金融科技的运用上。例如,英国金融行为监管局于2015年首次提出监管科技的概念,提出了基于区块链技术的监管和合规项目(BARAC),以提升适当性工作的质量。

英国Onfido公司运用人工智能技术为其他机构提供高效的员工及客户背景调查,通过与相关可信信息数据来源合作获取个人的详细信息,并通过交叉验证的方式核实用户的姓名、地址和出生日期等信息的准确性。毕马威发布了其在新加坡地区的 KYC(了解你的客户)实用程序案例,通过区块链、大数据等技术,使金融机构得以向 KYC 信息平台共享信息,该程序能减少重复工作并提供清晰的痕迹跟踪。

综上所述,境外相关国家或地区已经充分认识到大数据、金融科技等手段的重要性并积极进行实践探索,为我国解决适当性管理提供了有益的借鉴。

联邦学习的发展及应用


(一)联邦学习概述

联邦学习(federated learning)指的是在满足隐私保护和数据安全的前提下,设计一个机器学习框架,使各机构在不交换数据的情况下进行协作。通过把不同机构的“数据孤岛”像独立的“国家”一样联合起来,组成一个数据“联邦”,彼此之间可以在不共享数据的前提下联合建模,共享收益。其实现机制如下:每个参与者都是数据“联邦”的成员,参与者共同建立一个虚拟的模型,该模型允许参与者在数据不离开本地的情况下,通过交换模型参数或者中间结果,得到理想的输出结果。

联邦学习分为横向联邦学习、纵向联邦学习和迁移联邦学习三类,如图1所示:

图1:联邦学习的分类
在两个数据集的用户特征重叠较多而用户重叠较少的情况下,把数据集按照用户维度切分,并取出双方用户特征相同而用户不完全相同的那部分数据进行训练,这种方法叫做横向联邦学习。横向联邦学习的本质是样本的联合,适用于参与者间业态相同但触达客户不同,即特征重叠多,用户重叠少时的场景。
在两个数据集的用户重叠较多而用户特征重叠较少的情况下,把数据集按照特征维度切分,并取出双方用户相同而用户特征不完全相同的那部分数据进行训练,这种方法叫做纵向联邦学习。纵向联邦学习的本质是特征的联合,适用于用户重叠多,特征重叠少的场景。
在两个数据集的用户与用户特征重叠都较少的情况下,不对数据进行切分,而可以利用迁移学习来克服数据或标签不足的情况,这种方法叫做联邦迁移学习。当参与者间特征和样本重叠都很少时可以考虑使用联邦迁移学习,迁移学习的核心是,找到源领域和目标领域之间的相似性,主要适用于以深度神经网络为基模型的场景。

(二)联邦学习在金融领域的应用现状

近年来,银行、保险、消费金融等金融公司联合科技类公司,积极开展联邦学习的应用研究,期望在保护数据隐私安全的前提下达到业务协同发展的目标,实现多方共赢。

美国为联邦学习的发源地,在信用卡反欺诈和跨行反洗钱领域,美国已有金融机构摩根大通(JP Morgan)、科技公司IBM以及学术机构开展了联邦学习的理论探讨和建模测试。中国在联邦学习金融应用上起步稍晚,但逐渐显示了后发优势。

一方面,因为国家对金融科技的政策支持,鼓励金融科技创新,科技类公司存在政策红利;

另一方面,我国征信体系数据维度不够、有效性不足,金融机构有强大的动力推动联邦学习技术的应用,实现机构间数据的联合,提升行业的竞争力。

我国已进入试点阶段的联邦学习平台包括腾讯“神盾-联邦计算平台”、微众银行FATE、百度“百度金融安全计算平台”、京东科技Fedlearn、平安科技“蜂巢联邦智能平台”和华控清交“PrivPy多方计算平台”等。国内外金融业务联邦学习应用试点汇总见表1:

表1:国内外金融业联邦学习应用试点汇总




联邦学习在适当性管理中的应用研究与展望
科创板、创业板、股转公司、北交所等业务适当性管理的核心,最终转化为对投资者资产和交易经验两个客观数据的验证。交易经验为投资者首次交易日与当前时间的差距,首次交易日中国结算向全市场会员公开提供,容易获取,但投资者资产的核实职责就交给了各证券公司,对于多头开户的投资者,证券公司核实其资产总额是一项费时、费力且风险较高的工作。
自2015年A股市场放开一人一户限制后,投资者多头开户的情况非常普遍,加上A股市场投资者基数巨大,截至 2021 年底,投资者数量共计 19740.85 万。如何为多头开户的投资者进行安全、准确、低成本的联合适当性管理,是各证券公司及监管机构需要共同解决的问题。

(一)联合适当性管理面临的问题
通过共享投资者信息,将众多机构的数据合并成大数据,的确可以让金融机构在投资者适当性管理上,降低成本的同时提高管理效率,然而信息共享与投资者隐私保护之间存在巨大的冲突,可能面临违反法律法规的风险。
2021年开始实施的《民法典》和《个人信息保护法》中分别指出“信息处理者不得泄露或者篡改其收集、存储的个人信息;未经自然人同意,不得向他人非法提供其个人信息”, “个人信息处理者应当对其个人信息处理活动负责,任何组织、个人不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息”。随着法律法规的完善和投资者隐私保护意识的加强,如何合法合规地联合多方数据,实现跨机构协同作战,是各金融机构亟待解决的问题。
客户信息是证券公司的机密数据,客户资产信息更是证券公司的核心机密,联合适当性管理首先面临数据安全的问题,在使用数据的过程中,必须要保证本公司数据不能被其他公司获取,也要保证数据不发生外泄。
另外数据联合使用过程中,由于某一个公司数据质量出现问题,导致结果出错,该如何定位问题及划分责任,也是联合适当性管理必须要解决的问题。

(二)联邦学习实现联合适当性管理的途径

1、联邦学习实施联合适当性管理的技术优势

联邦学习的基本思想是“数据可用不可见,数据不动模型动”,现有的联邦学习算法,在严格保证原始数据和模型私密参数数据都原地不动的前提下,通过模型的移动得到联合计算结果。因此在联合适当性管理过程中,证券公司A可以使用证券公司B、C、D的数据,但是由于在计算的过程中,数据“可用不可见”,可以保证数据的安全性。

联合适当性管理,各证券公司使用同一个模型,相同的数据,任何一个参与者对他人都存在很强的依赖和制约,因此模型的决策机制应透明公开,且模型应可监控、可管理。即数据模型可朔源,数据归属可审计,数据质量可定责。

还有,在保证模型可监管的同时,应兼顾模型计算的效率,在参与方可接受的时间内,得出联合计算的结果。可信联邦学习可以实现数据安全、模型监管、计算效率三者之间的平衡,具备技术优势。

与其他行业相比,证券行业核心软件供应商单一,数据结构趋同,这为联邦学习的模型设计和算法设计提供了极大的便利,降低了设计的难度,联合适当性管理具有天然优势;证券行业是强监管行业,法律法规及规章制度完备,奖惩规则明确,会约束各参与方自觉维护联合学习体系的稳定,联合适当性管理具有外部优势。

2、通过联邦学习计算多头开户投资者的总资产

多头开户投资者的资产明细分布在各证券公司,通过一码通可以查询到投资者在哪些证券公司开立了证券账户,在取得投资者授权后,业务受理的证券公司可向其他证券公司发起资产计算请求,通过联合学习模型计算出资产总值,但不应该把资产总值直接返回给发起人,因为这样发起人可以根据总资产和投资者在本公司的资产,倒推出投资者在其他证券公司的资产,会造成数据泄露。从数据使用的最小粒度上看,模型计算结果只需返回投资者总资产是否满足某一业务的资产要求,即可达到发起人目的。

3、通过联邦学习实现投资者适当性动态管理

监管机构一直要求各证券公司做好投资者动态适当性管理,但由于动态适当性管理成本高、措施少,监管也无具体指导细则,证券公司并无动力加强对这方面的投入,导致动态适当性管理一直停留在形式合规上,并未做到实质管理。采用联合学习模型,监管机构可以监控市场上所有投资者实时是否满足适当性管理要求。

例如每日日终校验投资者资产是否满足适当性要求,若投资者资产长期不满足适当性要求,可取消投资者开通的权限。这种方式可有效减少投资者为开通权限借入资金,在开通权限后立即转出的现象;另外对于长期不满足适当性要求的投资者,取消其权限,防止其发生超出其承受能力的交易业务,也是对投资者的一种保护。从监控者角度看,实时、动态对市场投资者进行适当性管理,无疑能促进市场的健康、有序发展。

4、联合学习为新业务适当性管理标准提供数据支持

交易所拟推出新业务时,根据新业务风险水平,其适当性管理标准一般参照现有类似业务标准,但原标准是否适合新业务有待商榷。在业务正式开展前,交易所会对市场上满足适当性管理要求的投资者进行数据统计,基本上这些数据由各证券公司上报,这种数据统计模式存在两个问题:

第一种是多头开户的投资者在不同的证券公司都满足条件,这样会造成数据统计的重复;

第二种是投资者在单独一家证券公司资产并不满足要求,但其在多家证券公司的总资产满足要求,这种情形会造成数据的漏报。而资产量大的投资者多头开户的情况非常普遍,多种因素的叠加影响,导致交易所数据统计的有效性大打折扣。

另外由券商统计数据再上报的方式,耗时较长、成本较高且数据统计存在时延,对交易所的政策的制订,只能提供有限的支持。采用联邦学习模型,交易所可实时掌握市场上投资者资产全貌,将为新业务适当性管理规则的制定提供强有力的数据支撑。


(三)联邦学习在证券行业的应用展望
联邦学习的应用范围和场景,依赖于参与者提供的数据的有效产出,若将参与者的范围扩大,联邦学习的应用范围也会相应扩大。商业银行提供三方存管银行数据,可以得到投资者进入证券市场的资金来源,追踪投资者的资金是否为自有资金,从资金源头降低交易业务风险;人民银行提供征信数据,可以得到投资者信用情况及履约意愿,证券公司可以从信用维度对投资者进行风险预测,对高风险投资者进行有效控制;税务机构提供税务信息,可以得到投资者真实收入水平,可以为证券公司进行投资者精准营销提供数据支持;通讯运营商提供手机号实名数据,可以核实投资者提供的手机号是否为本人拥有,证券公司可据此核查账户实名使用情况。

还有公安机关提供的身份信息,人民法院提供的司法执行信息,都可以扩充联邦学习的应用范围。因此联邦学习在适当性管理取得一定成效后,可逐步扩大参与者范围,在金融行业进行推广,为金融行业的稳步、健康发展添砖加瓦。


【参考文献】

[1]杨强.AI与数据隐私保护:联邦学习的破解之道[J].信息安全研究,2019,5(11):961-965.

[2]华泰证券课题组.证券公司投资者适当性管理的大数据应用研究[J].金融纵横,2019(07):13-21.

[3]井漫.投资者适当性制度构建:国际经验与本土选择[J].证券市场,2020(04):65-77.

[4] 陈琨,李艺,王国赛,等.联邦学习在金融行业的应用分析[J].征信,2021(10):29-36.

[5]张海涛.联邦学习在金融数据安全领域的研究与应用[J].信息技术与网络安全,2022(41):3-9.

[6]王国赛,李艺,陈琨,等.隐私计算技术的金融应用思考[J].金融发展研究,2022(08):31-37.

[7]袁均良.隐私计算在金融行业应用及其影响[J].金融科技时代,2022(10):23-28.

[8]徐葳.联邦学习概念辨析与金融应用思考[J].银行家,2022(03):102-106.

[9]Yang Q, Liu Y, Chen T, et al. Federated machine learning[J].ACM Trans on Intelligent Systems and Technology,2019,10(2):1-19.


来源:《中国证券》

END

热门文章:




隐私计算头条周刊(09.18-09.24)


理解零知识证明的三个典型示例


校招丨2023-2024应届生隐私计算技术岗位(北京)


重磅!《2023全球隐私计算报告》开启征集!


加入我们丨OpenMPC社区招募实习生

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存